小模型训练效率狂飙100倍!Thinking Machine推“在线策略蒸馏”,OpenAI前CTO亲自点赞
近日,AI新锐团队Thinking Machine发布突破性训练方法——在线策略蒸馏(On-Policy Distillation),让小模型在特定任务上的训练效率提升高达50至100倍。该成果一经公布,即获前OpenAI首席技术官Mira Murati亲自转
machine thinki thinkingmachine 2025-10-28 12:23 2
近日,AI新锐团队Thinking Machine发布突破性训练方法——在线策略蒸馏(On-Policy Distillation),让小模型在特定任务上的训练效率提升高达50至100倍。该成果一经公布,即获前OpenAI首席技术官Mira Murati亲自转
machine thinki thinkingmachine 2025-10-28 12:23 2
简单来说,Tinker 是一个 API,用于帮开发者 / 研究人员微调语言模型。重要的是,在此过程中,你只需要专注于训练数据和算法,而你不擅长的关于 Infra 的部分 —— 调度、调优、资源管理和 Infra 可靠性 —— 统统由 Tinker 来搞定,这将
tinker thinkingmachines thinki 2025-10-02 11:10 6
“My dear Mr. Bennet,” replied his wife, “how can you be so tiresome! You must know that I am thinking of his marrying one of them.